Reinforcement Lernen mit Regularisierungsnetzwerken

نویسنده

  • Tobias Jung
چکیده

This thesis aims at learning autonomously optimal behavior for high-dimensional control tasks using reinforcement learning with a kernel-based approach. Harnessing the representational power of kernelbased methods we hope to escape the so-called ’curse of dimensionality’, which otherwise implies an exponential growth in the number of basis functions. Specifically, we apply regularization networks as underlying function approximator in least-squares based policy evaluation. The samples used to build this approximation are generated online, from an agent interacting with the environment. This poses an enormous computational challenge since kernel methods inherently scale with O(n3), where n is the number of training samples.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Tiefes Reinforcement-Lernen auf Basis visueller Wahrnehmungen

Mit Hilfe des wertfunktionsbasierten Reinforcement Lernens (RL) konnten in letzter Zeit einige sehr beachtliche Erfolge beim Erlernen der Steuerung realer, dynamischer Systeme erzielt werden. Bestehende Ansätze sind aber immer noch auf die Lösung von Problemen mit sehr niedrigdimensionalen Zustandsräumen beschränkt. Diese Einschränkung verhindert bisher eine direkte Anwendung auf die von einer ...

متن کامل

Dateneffizientes Reinforcement-Learning

Obwohl sich mittels Reinforcement-Learning optimal agierende Agenten für eine sehr allgemeine Problemklasse entwickeln lassen und bereits 1992 am Beispiel von Backgammon gezeigt wurde, dass auch komplexe Probleme gelöst werden können, ist die Liste der praktischen Anwendungen, in denen Reinforcement-Learning bisher eingesetzt wurde, noch immer recht kurz. Dies liegt unseres Erachtens nach daran...

متن کامل

Kognitive Robotik - Herausforderungen an unser Verständnis natürlicher Umgebungen

Wir diskutieren einen Ansatz, der kognitive Robotik als die Erweiterung der Methoden der Robotik – insb. Lernen, Planen und Regelung – auf “äußere Freiheitsgrade” versteht. Damit verschiebt sich der Fokus: Weg von Gelenkwinkeln, Vektorräumen und Gauß’schen Verteilungen, hin zu den Objekten und der Struktur der Umwelt. Letztere können wir nur schwer formalisieren und in geeignete Repräsentatione...

متن کامل

Statistisches Lernen wortbasierter Morphologie

Im Rahmen der Promotion wird ein Ansatz zum automatischen Lernen von Sprachmorphologie entwickelt. Dabei wird auf die Zerlegung von Wörtern in kleinere strukturelle Elemente (die s.g. Morpheme) verzichtet und stattdessen mit Transformationsregeln gearbeitet, die an ganzen Wörtern operieren. Das Lernen wird mithilfe eines probabilistischenModelles realisiert, das mit dem EM-Algorithmus trainiert...

متن کامل

Multimediales Lernen mit CogniPedia: Ein Online-Autorenwerkzeug zur Erstellung und Publikation interaktiver Bilddetail-Aufgaben im Web

Der Beitrag beschreibt die Konzeption, Implementierung und Evaluierung des web-basierten E-Learning Systems CogniPedia. Mit dieser Lernplattform können Schaubilder und im Speziellen Detailabbildungen sowie deren zugehörige Metadaten, die jeweils komplexe fachliche Kontexte darstellen, mittels interaktiver Aufgaben effizienter erlernt werden. Strukturen und Zusammenhänge sollen hierzu zum intera...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2007